读文献就像重测序——怎样高效阅读科研文献 | 学习专栏
重测序作为一种被广泛应用的测序和研究策略,相信大家或多或少都有所了解。重测序是指对序列已知的物种进行测序,并且将测序数据与参考序列进行比对,并根据比对结果进行变异位点识别等分析。
参考序列的获得可以通过从头测序并组装的方式获得,当然也可以直接从NCBI等数据库中下载组装好的基因组序列来作为参考序列。在获得参考序列之后,便可以进行将测序reads比对到参考序列上并进行变异挖掘的核心过程。
参考序列的获得(从头测序/数据库下载)
变异挖掘的过程示意
其实阅读文献的过程,和重测序非常相似。第一步,也是最重要的一步,就是构建自己的reference。Reference用在重测序里,指的是参考序列,而在写论文的时候,则指的是参考文献,或者说是你的知识背景。任何研究都不是从无到有的创新,都需要基于深厚的背景知识来开展。越创新的研究,背后所需的知识积累就越深厚。换句话说,背景知识积累的深度,决定了创新的高度和视野的广度。
建立参考序列的时候可以使用从头测序的方式来进行组装,而构建一个特定领域的知识背景,也可以通过类似的方式来进行文献阅读。对于一个特定的研究领域(围绕某一个研究对象或者某一种研究方法),都有一些重要的节点文献。这类文献通常开拓了新的研究方法或者研究思路,并且有比较详细的原理与方法描述。跟着节点文献进行阅读,可以对特定领域的发展脉络进行仔细的梳理,对该领域有大致的切入和理解,同时结合近年的研究文献,可以对该领域有一个较全面的把握。但就像从头测序一样,比较费时费力。
BSA发展历史的节点文献
当然是有的。大部分时候,这种梳理文献的工作已经有人做好了,并整理成综述发表出来。通过阅读综述文献,可以极大地减少我们构建知识背景的时间,提高效率。
我们可以选择本领域重要的,引用数量多的,发表时间近的综述文献阅读,但是综述作为纯干货的集合,每一句话可能都包含了相当重要的信息,所以阅读务必仔细、耐心,打印出来放在手边备查也是个好选择。在读综述上投机取巧节省的时间一定会在以后加倍地浪费掉。
如果时间充裕的话,综述阅读可以和节点文献阅读相互印证,对自己的知识背景进行补充。耐心地构建自己的知识背景体系,是踏上学术道路之前的重要准备工作。
得到参考序列之后,在比对测序数据之前,还需要做的一个步骤是建立Index,即索引。同样的,我们再阅读文献的同时,也需要做好文献整理和内容笔记。否则当我们的文献越读越多之后,想要迅速回想起某个结论来自于哪篇文献恐怕不太容易。最理想的文献管理方式当然是用Endnote等文献管理软件来进行,应用自如以后可以成为论文写作的“大杀器”。如果习惯通过PDF文件的方式来保存文献,记得在文件名上做好标注,包括发表时间、内容、杂志等。同时,各类思维导图、云笔记软件也值得我们去好好利用,快捷的整理和搜索可以为我们节约大量时间。
有了参考序列之后,我们不必再费劲地做组装,而是使用比对的方式高效地对测序数据进行分析;而在有了相应的知识背景积累以后,我们也可以使用更高效的方法来进行文献阅读。这种读文献的方式更关注一个研究的创新点,而沿用前人方法的部分可以略过或者简要阅读,正如重测序更关注基因组上的变异信息。
在这种阅读文献的模式下,并不需要完整地阅读整篇文献的每个词句,只需要根据文献创新性大小进行选择性阅读。通常阅读摘要、图片之后,就可以对文章的大致轮廓有所了解。如果有需要,再深入阅读关注的部分。譬如以方法为导向进行阅读可能更关注结果展现形式或是研究方法创新,以研究对象为导向可能更关注研究结论等。
以下图一篇新发表的BSA论文为例,通过阅读摘要和图片,我们就可以对文章的主要工作有一个大致的了解。作者通过简化基因组+BSA的方式对向日葵抗列当性状进行定位,并且对定位到的候选基因进行个体基因分型并与性状进行验证。
论文摘要及其中的重点部分
展示论文主要结论的图片
如果在基因组上有重点关注的区域,不妨设计探针来个VB捕获测序;如果读文献的时候有明确的重点关注目标(譬如特定基因的某个功能、某种方法的特定步骤等),那么就带着目标进入文献当中进行寻找。
只收集文献当中的某一点重要信息的话可能不会花费多少时间,但是正如VB捕获过程中探针质量至关重要一样,使用这种读文献策略的时候,目的是否明确至关重要。这能够保证我们获得准确的关键信息,避免被其他信息干扰。同时我们也要注意到带着目的去读文献的时候也可以快速浏览多篇文献的方式去收集关键信息(就像VB通常测序深度很高一样),量变最终会引起质变。
譬如通过阅读大量简化基因组构建遗传图谱的文献,我们可以对使用的酶组合、筛选的片段大小和物种进行梳理,并大致推断基因组大小与使用的酶以及片段大小之间的大致关系。
简化基因组构建遗传图谱文献中物种、酶和片段大小信息
• 构建知识背景
– 阅读节点文献
– 阅读综述
– 做好整理和记录
• 高效阅读研究文献
– 关注创新点,阅读摘要和图片
– 不需要逐字逐句阅读
• 文献重点捕捉
– 带着清晰的目的去阅读文献
– 以量变带来质变
文献管理神器Endnote教程四——编辑参考文献格式(一) | 分析技能